其他

AlphaGo背后:深度学习的胜利 | 深度学习的商业价值到底在哪里?

2017-01-09 战略前沿技术

来源:三联生活周刊(ID:ilifeweek),作者:曹玲 


对于围棋人机大战,很多人折服于AlphaGo的精准、聪明和大局意识。人们问AlphaGo为什么如此厉害,工程师给出的答案是它有“两个大脑”:一个输入了3000万盘人类顶级棋手对弈数据,通过“自我对战”来进行增强学习,改善此前的决策网络;另一个通过价值网络来进行整体局面判断,决策网络与价值网络协作决定落子位置。

AlphaGo的技术架构采用的是模仿人类大脑神经的模式,通过深度学习把人工神经网络的层级大大增加,提升了计算能力。AlphaGo的胜利,让如今已经很火的深度学习益发成为人工智能领域的焦点。

Alpha Go训练深度学习+强化学习两套神经网络的流程

人工神经网络起伏

2011年,谷歌X实验室的研究人员从YouTube视频中抽取了1000万张静态图片,把它“喂”给谷歌大脑,在这些图片中寻找重复出现的模式。谷歌大脑就是一个采用了深度学习技术的大型神经网络模型,由1000台电脑组成。三天后,谷歌大脑在没有人类帮助的情况下,从这些图片中发现了“猫”。这件事在人工智能界引起了很大轰动,被认为是深度学习复兴的里程碑。

简单地说,人工神经网络是一种从信息处理角度对人脑神经元网络进行抽象,按不同的连接方式组成不同网络的算法数学模型。它由一层一层的神经元构成,层数越多就越深。而所谓深度学习就是用多层神经元构成的神经网络,以达到机器学习的功能。这些多层的电脑网络像人类大脑一样,可以收集信息,并基于收集到的信息产生相应的行为,也就是“认识”事物,并做出行动。

人工智能的发展和人们对大脑的认知水平相辅相成。1943年,神经生理学家沃伦·麦卡洛克(Warren McCulloch)与精通数学的学生沃尔特·皮茨(Walter Pitts)合作,一起提出了神经元网络模型,沿着图灵关于通用计算机的论述,他们认为人类神经元具有计算机1和0那样的逻辑功能,指出了神经元的数学描述和网络结构。数学概念的介入,为人类理解并创造智能提供了途径,开启了人工神经网络时代。

在上世纪四五十年代,计算机还是一个新鲜产物,第一代人工智能研究者急切地幻想成熟的人工智能技术近在眼前。但当研究者发现实际的知识里蕴含着巨大复杂度时,他们渐渐不再乐观,尤其是遇到一个感知问题,比如说人脸与面具或猴子脸的区别到底在哪里。许多研究者与学者花了几十年时间对计算机识别物体所必备的不同特征的规则进行手动编程。但是找出特征是件难事,耗费很多时间,并且需要专业知识,急需研究者找到更好的解决方法。

当时有位叫马文·明斯基(Marvin Minsky)的科学家,在1951年建造了第一台神经网络机SNARC。他是麦卡洛克和皮茨的学生,后来被誉“人工智能之父”,今年1月24日刚刚去世,人工智能界写了大量文章进行悼念。


美国科学家马文·明斯基在1951年建造了第一台神经网络机SNARC

1957年,康奈尔大学的实验心理学家弗兰克·罗森布拉特(Frank Rosenblatt)在一台IBM-704计算机上模拟实现了一种他发明的叫“感知器”的神经网络模型,依据的原理是当时人们理解的学习机制:当一个神经元反复激活另一个神经元,细胞就提高了它们的连接效率。

感知器占据了整个实验室,它包括三层结构,运作机制并不复杂。感知器的一端,400个光传感器模拟视网膜;传感器多次连接一组512个电子触发器,当它通过一个特定的可调节的兴奋阀值时就会像神经元一样激发。这些触发器连接到最后一层,当一个物体与感知器受训见过的对象相互匹配时,它就会发出信号。这个模型可以完成一些简单的视觉处理任务。

1958年夏,罗森布拉特和他的赞助方美国海军举行了新闻发布会。《纽约时报》当时报道说:“海军透露了一种电子计算机的雏形,它将能够走路、说话、看、写、自我复制并感知到自己的存在……据预测,不久以后,感知器将能够识别出人并叫出他们的名字,立即把演讲内容翻译成另一种语言并写下来。”

明斯基于1969年出版了《感知器》一书,暗示了感知器具有重大局限,不能解决人工智能的问题。这本书的杀伤力是巨大的,随即神经网络研究便因为联结主义的式微被打入冷宫,所有原来的政府资助机构也逐渐停止对神经网络的研究。1971年,罗森布拉特43岁生日那天因游船事故去世,有传言他是自杀。


20世纪60年代,美国心理学家弗兰克·罗森布拉特在康奈尔大学昆虫系做实验,研究小鼠的学习行为

后来神经网络得势后,当时受压迫的科学家认为明斯基不可原谅,纷纷对其口诛笔伐。美国电气电子工程师协会(IEEE)于2004年设立了罗森布拉特奖,以奖励在神经网络领域的杰出研究。

上世纪80年代初,加州理工生物物理教授霍普菲尔德(Hopfield)提出了一种新的神经网络,可以解决一大类模式识别问题,还可以给出一类组合优化问题的近似解。一帮早期神经网络研究的幸存者,在DNA双螺旋结构发现者弗朗西斯·克里克(Francis Crick)和认知科学家唐·诺曼(Don Norman)的鼓励下,以加州大学圣地亚哥分校为基地开始了“联结主义”运动,领导者是两位心理学家外加一位计算机科学家杰夫·辛顿(Geoffrey Hinton)。

在学术上,人工智能有三种学派:符号主义、联结主义和行为主义。符号主义认为人工智能源于数理逻辑,行为主义认为人工智能源于控制论,而联结主义认为人工智能源于仿生学,特别是对人脑模型的研究,人工神经网络是这一理论的杀手锏。

人类大脑的思维分为抽象(逻辑)思维、形象(直观)思维和灵感(顿悟)思维三种方式。20世纪80年代,在符号主义学派影响下,许多人工智能的专家系统被制造出来。它们的抽象思维异常强大,在解决逻辑性强的专业问题上,速度比人类快很多,比如医疗诊断、矿产勘探等问题。但是这类人工智能欠缺人类最基本的感知能力,连猫和狗都区别不开,人工神经网络有机会展示出它解决机器形象思维的能力。

起初,辛顿等人的研究并不顺利,但是他们相信,计算能力的增强以及数字数据爆炸将会再次推动人工神经网络的发展,自己的算法将给世界带来惊奇。

2006年,辛顿在《科学》杂志上发表了有关深度学习的论文,重新审视深度学习方法,将深度学习的性能提升到了一个新的台阶。

2009年,辛顿小组获得了意外的成功,他们的深度学习神经网络在语音识别应用中取得了重大突破,转换精度突破世界纪录,错误率比以前少了25%。有评论说,辛顿小组的研究让语音识别领域缩短了至少10年的时间。他们的突破吸引了各大公司的注意,苹果公司把研究成果应用到了Siri语音识别系统上。从此,深度学习的流行便一发不可收拾。


出生于英国的计算机科学家杰夫·辛顿

2010年,美国国防部DARPA计划首次资助深度学习项目,参与方有斯坦福大学、纽约大学和NEC美国研究院。2012年,深度学习技术在图像识别领域取得惊人的成果,在ImageNet评测上将错误率从26%降低到15%。同年,制药公司将深度神经网络应用于药物活性预测问题取得世界范围内最好结果。2013年4月,麻省理工学院《技术评论》杂志将深度学习列为2013年十大突破性技术之首。

研究人员认为,深度学习是个很好的解决方案。它能从抓取的数据中生成自己的规则,提供一种采用受大脑启发机制的对称性来完成类大脑功能。这种策略需要模拟神经元并将之组织成多个层次。拿人脸识别来说,当系统面对一张图片时,学习系统的第一层仅能简单区分其中的明暗像素点。下一层就能意识到某些像素点构成了边界,再往下一层就能区别水平和垂直线条。最后一层能识别出眼睛,并且认识到人脸中通常有的两只眼睛。

如今,神经网络研究如日中天。由于擅长处理语音、视觉以及其他复杂人机交互,神经网路已经被谷歌、Facebook、微软、百度等技术先驱欣然采纳。在这些公司里,神经网络已经证明了一种有效的可以吸收大量数据并从中进行有价值预测的处理方式,比如怎样让你的数据中心更高效节能、此用户之后有买车的意愿吗?科技公司对每一位擅长神经网络的程序员展开了激烈角逐,重金聘用人才,不惜到研究机构去挖角。

后来,辛顿和两个学生开创了一家专注深度学习的公司DNNresearch。公司成立没多久,谷歌和微软就对这家公司动了收购的念头,后来百度也加入竞标,最终2013年谷歌出了几千万美元收购了这家只有三名员工的公司。此次收购不如说是收编更准确,谷歌把包括辛顿在内的三位人才收归麾下。

有人问,人工神经网络起起伏伏,为何会复兴于这个时代?

神经网络需要学习大量实例,就像小孩收集现实世界的信息一样。上世纪80年代到90年代,由于没有太多的数字信息可用,计算机要花费很长的时间去确定有些什么信息。因此,这一时期的技术应用非常少,其中一个是由深度学习的大佬之一燕乐存(Yann LeCun)开发的技术,现在被银行用于手写支票识别。

当我们将超大规模的训练数据喂给深度学习模型的时候,这些具备深层次结构的神经网络就摇身一变,成为拥有感知和学习能力的大脑,表现出了远远好于传统神经网络的学习能力。

业内人士描述深度学习和大数据的关系,就像火箭和燃料一样:火箭虽然厉害,但是没有大数据这个燃料也只是一堆废铁。而且这个模型对原始数据来者不拒,无论属于图像识别、语言识别、NLP、生物医药等哪个领域,都可以“喂”给神经网络学习处理。而且,喂给它的数据越多,它就变得能力越强、越聪明,并且只会吃不饱,不会消化不良。这和大脑的工作原理很相似,大脑用同一套算法解决视觉、听觉、嗅觉等感知问题。因为大数据的必不可少,我们也看到深度学习做得最好的地方是我们熟知的那些拥有大量数据的IT巨头。

如今,深度学习似乎无孔不入:深度学习识别出患有自闭症风险的基因;深度学习为图片和视频自动添加标题;深度学习识别大型强子对撞机中的粒子;使用深度学习来制造无人驾驶汽车和机器人。

即便如此,深度学习也不是万能的。人工智能包括三个方面。第一是感知,就是知道周围环境是什么,知道和对方交互的时候对方在说什么,要表达什么意思,感知不是感觉但包含感觉。第二是认知,在感知的基础上去理解。比如机器已经能识别人类的语言,但是它能不能听懂其中的意思、理解人类的话?第三是决策,依据理解做出行动。

目前,感知和决策智能已取得巨大的进步,甚至在某些方面已经超越人类,但是在认知方面还有很大的差距,机器依然听不懂人的意思。机器学习不是万能的模型,将来还会出现更好的解决方式。

模拟人脑

既然深度学习模型成功的秘诀之一就在于它模仿了人类大脑的深层体系结构,那么我们为什么不直接模拟人类的大脑呢?事实上,科学家们已经行动起来了。

例如,德国海德堡大学的FACETS计划就是一个利用硬件来模拟大脑部分功能的项目。他们采用数以千计的芯片,创造出一个包含10亿神经元和1013突触的回路的人工脑,复杂程度相当于人类大脑的十分之一。与此对应,由瑞士洛桑理工学院和IBM公司联合发起的“蓝脑计划”则是通过软件来模拟人脑的实践。他们计划2020年左右制造出科学史上第一台会“思考”的机器,将可能拥有感觉、痛苦、愿望甚至恐惧感。


在美国纽约市水牛城的康奈尔航空实验室内,一名工作人员在调节罗森布拉特发明的人工神经网络中的电线和光线感应器(摄于1960年)

然而,这类研究计划也有很大的局限性。其中最大的问题就在于,迄今为止,我们对大脑的结构以及动力学的认识还相当初级,尤其是神经元活动与生物体行为之间的关系还远远没有建立。尽管科学家早在30年前就已经弄清楚了秀丽隐杆线虫302个神经元之间的连接方式,但到现在仍然不清楚这种低等生物的生存方式,比如进食和交配是如何产生的。尽管科学家已经做过诸多尝试,但是还不足以解释不断变化的电信号是如何产生特定认知过程的。

于是,为了进一步深入了解大脑的运行机制,一些大科学项目先后启动。2013年1月,美国奥巴马政府宣布“脑计划”的启动,该计划在2014年的启动资金为1亿多美元,致力于开发能记录大群神经元甚至是整片脑区电活动的新技术。

同年4月,欧盟也发起了“人类大脑计划”,这一计划为期10年,耗资16亿美元,致力于构建能真正模拟人脑的超级计算机。2014年10月,日本发起了本国的大脑研究计划,主要是通过对狨猴大脑的研究来加快人类大脑疾病,如老年性痴呆和精神分裂症的研究。

中国不甘落后,“十三五”规划纲要草案已经把脑科学和类脑研究列入国家重大科技项目,主要有两个研究方向:以探索大脑秘密、攻克大脑疾病为导向的脑科学研究,以及以建立和发展人工智能技术为导向的类脑研究。

这似乎让人们想到了第二次世界大战后的情景,各国争相发展大科学项目:核武器、太空探索、计算机等等。脑科学的时代已经来临,人工智能能否借助脑科学的发展,获得下一步的飞跃?


深度学习的商业价值到底在哪里?

本文转自:将门创投(ID:thejiangmen

来源:NVIDIA Blog,编译:任杰骥

你可能不是一个F1方程式赛车迷,但是你一定为这款迷人的机器所打动,流线型的外观、优美的设计、激情的速度,以及将来可能也会出现在你的小车里的众多高科技。

如今的机器学习,就像一辆性能优异的F1赛车一样,迅速、迷人、充满力量,并在紧要关头出击,在复杂的围棋比赛中完全取胜。

深度学习大放异彩,也为我们提供了更多的机会。我们不仅仅可以将深度学习技术应用到电视节目和棋盘比赛上,更能应用到我们在自己业务中的实际问题里去。

一句话,机器学习可以挣大钱!

和F1相比,机器学习可能更为重要,因为它不仅是握在手上的一两件工具,更是一辆完整的车子,还提供了老司机。

对于商业化场景,我们需要回答的问题是:你要到哪里去?更确切的说,是你可以利用机器学习帮助你解决什么问题,如何让研究者帮助你在商业竞争中脱颖而出,赢得新的客户。

深度学习和游戏化理论

首先让我们回顾一下在去年围棋比赛中AlphaGo的表现。它的对手是韩国的围棋大师李世石,要在给定的规则和前提下赢得比赛。AlphaGo通过大量训练掌握围棋的技巧,并寻找赢得更多次比赛的路径。


对于AlphaGo来说,它的目标就是在围棋的规则限制和情境交互中,利用深度学习算法,最终打败围棋大师李世石。

这样的想法也可以迁移到自动驾驶领域中。相比而言,交通和驾驶是一个更加复杂的场景,它包含多个交互对象——其他的司机,可能是人类也有可能会是人工智能驾驶者,而棋盘则变成了情况实时在变化的道路。

在这样的场景下,“成功”的定义也许是从安全地从家开到单位,同时要保证汽车有足够地油开到目的地;或者是在安全地情况下尽可能快地到达单位。不同地驾驶员会有不同的限制和不同的目标。而这些目标会在操作规则的范围内,通过与其他中间人的交互而完成。

从无人驾驶车再到无人机,Amazon则希望利用自动化无人机实现包裹快递。他们的成功目标是迅速、安全的将一双鞋空运并空降到正确的地址。

如果从游戏化(gamification)理论的角度去看,几乎所有的人类行为都可以用一种游戏的规则和目标去表述。这样看来,我们就可以想到机器学习巨大的潜在应用。

优化制造业

在制造业的生产线上,如果说目标是尽可能多的生产合格产品的话,那么可以用机器学习训练一套深度神经网络(DNN)系统,来优化调节生产线上所有的参数去实现这一目标。还可以进一步将这些参数拓展到整个产品的供应链,以及供应链之外的所有环节。

在正确数据的训练下,深度神经网络可以为了目标的实现不断调节商业过程中的参数。比如旺季时关注生产量,而到了淡季则注重效率。当竞争对手的价格变化或者是商业模型变化时,机器学习会自动地调节参数。

提升工业设计

机器学习还可以用来设计下一代产品。通用电气(GE)利用传感器采集的数据流和机器学习技术,来优化从油井到喷气式发动机的设计。

但他们的应用并不止于此,GE还将机器学习应用于提高未来产品的设计,调节不同的参数观察所产生的效果。

更好喝的啤酒、更多的利润、更智能的预测


Analytical Flavor Systems是美国宾州的一家软件设计初创公司,他们利用评酒师的数据用来帮助客户酿造更纯正的啤酒。这家公司的深度神经网络叫做Gastrograph,可以识别许多种啤酒的特性,并通过算法训练找到饮酒者钟爱的那些啤酒特性,为啤酒品牌提高产品的竞争力。

NBA的勇士队和骑士队都在使用机器学习技术。这一技术利用机器视觉和统计理论来预测每一位球员在不同比赛场景中的表现。试想如果他们发现库里在最后三分命中率下降,这将对他们十分有利。

位于旧金山的金融技术初创公司Affirm,则将机器学习技术用在了产品开发的每个阶段,从原型起一直到最终的产品落地。最终建立的信用和欺诈模型,帮助公司判断哪些借款申请人信用良好。对Affirm公司来说,在正确的时间把正确金额的钱贷给正确的人,这就是他们通过开发模型希望实现的最理想目标。

机器学习将如何帮助我们的业务?

对于Google,Facebook,Amazon,Nerflix和其他主营数据业务的公司来说,机器学习无疑是一件强大的工具。但是你也可以在上面的例子——啤酒、个人贷款、油井、篮球比赛等领域看到机器学习无处不在的身影。

大数据已经在我们耳边萦绕多年,大多数公司已经投身于这股大潮中,CEO和CTO们都意识到了在商业流程中收集数据的重要性。这是只是第一步而已。第二阶段便是对这些数据进行分析和处理;而第三阶段便是我们正在步入的机器学习。

机器学习能帮助商业活动建立起更为面向未来的预测模型,并更有针对性的告诉你面对分析结果,业务应该如何改进和提高。

和早期雷声大雨点小的大数据时代相比,如今的机器学习已经在各个领域取得了惊人的进展。它不仅在游戏中打败了人类,也在像苹果Siri这样的大规模日常应用中取得了成功,在核磁共振影像诊断中实现远快于人类的精确检测,在Saas平台上不断提高HR系统或数据中心管理的性能……机器学习正在方方面面改变着世界。

惊喜的事情不止于此,各大公司如Google、Facebook、Amazon以及NVIDIA都在为初创公司开源他们的算法和资源,来帮助他们的成长和壮大。

这并非这些公司大发善心,而是一种从服务和硬件角度、清晰建立在机器学习之上的商业模式。作为初创公司的你,并没有数据和科学团队,而只有和每个公司一样需要解决的商业问题。

作为公司的CEO和CTO,你已经明白机器学习会为你的业务带来不一样的精彩。那么与其被那些基于机器学习的火爆应用分神,不如专注于一个简单的商业问题,并致力于用机器学习或者自动化来解决,甚至仅仅改进已有的解决方案也很不错。

机器学习是一辆十分拉风的车,但首先你得要上车,老司机才能带你挣钱!

本文由将门创业(thejiangmen)原创编译

如需转载,请在微信公众号中回复“转载”,获得许可

一网打尽系列文章,请回复以下关键词查看:

创新发展:习近平 | 创新中国 | 创新创业 | 科技体制改革 | 科技创新政策 | 协同创新 | 成果转化 | 新科技革命 | 基础研究 | 产学研 | 供给侧

热点专题:军民融合 | 民参军 | 工业4.0 | 商业航天 | 智库 | 国家重点研发计划 | 基金 | 装备采办 | 博士 | 摩尔定律 | 诺贝尔奖 | 国家实验室 | 国防工业 | 十三五

预见未来:预见2016 | 预见2020 | 预见2025 | 预见2030 | 预见2035 | 预见2045 | 预见2050 |

前沿科技:颠覆性技术 | 生物 | 仿生 | 脑科学 | 精准医学 | 基因 |  基因编辑 | 虚拟现实 | 增强现实 | 纳米 | 人工智能 |  机器人 | 3D打印 | 4D打印 | 太赫兹 | 云计算 | 物联网 | 互联网+ | 大数据 | 石墨烯 | 能源 | 电池 | 量子  | 超材料 | 超级计算机 | 卫星 | 北斗 | 智能制造 | 不依赖GPS导航 | 通信 | MIT技术评论 | 航空发动机 | 可穿戴 | 氮化镓 | 隐身 | 半导体 | 脑机接口

先进武器:中国武器 | 无人机 | 轰炸机 | 预警机 | 运输机 | 战斗机 | 六代机 |  网络武器 | 激光武器 | 电磁炮 | 高超声速武器 | 反无人机 | 防空反导 | 潜航器 |

未来战争:未来战争 | 抵消战略 | 水下战 | 网络空间战 | 分布式杀伤 | 无人机蜂群

领先国家:俄罗斯 | 英国 | 日本 | 以色列 | 印度 

前沿机构:战略能力办公室 | DARPA | Gartner | 硅谷 | 谷歌 | 华为 | 俄先期研究基金会 | 军工百强

前沿人物:钱学森 | 马斯克 | 凯文凯利 | 任正非 | 马云

专家专:黄志澄 | 许得君 | 施一公 | 王喜文 | 贺飞 | 李萍 | 刘锋 | 王煜全 | 易本胜 | 李德毅 | 游光荣 | 刘亚威 | 赵文银 | 廖孟豪

全文收录:2016文章全收录 | 2015文章全收录 | 2014文章全收录 

其他主题系列陆续整理中,敬请期待…… 

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存